我们提出了一种基于神经网络(NN)的算法,用于用于窄带物理随机访问通道(NB-iot)的窄带物理随机通道(NBRACH)的设备检测和到达时间(TOA)和载体频率偏移(CFO)估计(nprach) 。引入的NN体系结构利用了剩余的卷积网络以及对5G新无线电(5G NR)规格的序言结构的了解。第三代合作伙伴项目(3GPP)城市微电池(UMI)频道模型的基准测试,其随机用户与最先进的基线相对于最先进的基线表明,该提出的方法可在虚假的负率(FNR)中最多8 dB增益(FNR)以及假阳性率(FPR)和TOA和CFO估计精度的显着增长。此外,我们的模拟表明,所提出的算法可以在广泛的通道条件,CFO和传输概率上获得收益。引入的同步方法在基站(BS)运行,因此在用户设备上没有引入其他复杂性。它可能通过降低序列长度或发射功率来延长电池寿命。我们的代码可在以下网址提供:https://github.com/nvlabs/nprach_synch/。
translated by 谷歌翻译
事件日志被广泛用于复杂系统中的异常检测和预测。现有的基于日志的异常检测方法通常包括四个主要步骤:日志收集,日志解析,特征提取和异常检测,其中特征提取步骤提取有用的功能,可通过计数日志事件来进行异常检测。对于一个复杂的系统,例如由大量子系统组成的光刻机器,其日志可能包含数千个不同的事件,从而导致富含提取的功能。但是,当在子系统级别进行异常检测时,分析所有功能变得昂贵且不必要。为了减轻此问题,我们为基于日志的异常检测和预测开发了一种功能选择方法,从而在很大程度上提高了有效性和效率。
translated by 谷歌翻译
长期以来一直研究规则集学习,并且由于需要可解释的模型,最近经常被重新审视。尽管如此,现有方法仍有几个缺点:1)最新方法需要二进制特征矩阵作为输入,直接从数字变量中学习规则; 2)现有方法在规则之间施加命令,无论是明确或隐式而损害解释性的; 3)当前,对于多级目标变量学习概率规则集尚无方法(只有一种概率规则列表的方法)。我们提出了TUR,以解决真正无序的规则集,以解决这些缺点。我们首先将学习真正无序规则集的问题形式化。为了解决由重叠规则引起的冲突,即多个规则所涵盖的实例,我们提出了一种利用规则集的概率属性的新方法。接下来,我们开发了一种两阶段的启发式算法,该算法通过精心发展的规则来学习规则。一个重要的创新是,我们在学习地方规则时使用替代得分来考虑规则的全球潜力。最后,我们从经验上证明,与非稳定和(明确或隐式)有序的最新方法相比,我们的方法学习规则集,这些规则集不仅具有更好的解释性(即它们是较小且真正的无序),,但也更好的预测性能。
translated by 谷歌翻译
高科技设备批判性依赖于精确操作和测量的柔性。通过弹性变形,柔性在其自由度的有限运动范围内提供极端位置重复性,而在约束的限制中的约束运动。拓扑优化证明了一种用于设计短行程弯曲的前瞻性工具,提供最大的设计自由并允许特定于应用的要求。弯曲合成的最先进的拓扑优化配方受到易于使用,多功能性,实施复杂性和计算成本的挑战,留下普遍接受的制剂。本研究提出了一种新颖的拓扑优化制剂,用于在规定的位移场景下独特地为短语屈曲合成短程弯曲。由此产生的自相伴随优化问题与经典合规性最小化和继承了类似的实现简单,计算效率和收敛性。数值示例展示了柔性类型的多功能性和附加设计要求的可扩展性。提供的源代码鼓励在学术界和工业中探索和应用制定。
translated by 谷歌翻译
我们介绍了强大的子组发现的问题,即,找到一个关于一个或多个目标属性的脱颖而出的子集的一组可解释的描述,2)是统计上的鲁棒,并且3)非冗余。许多尝试已经挖掘了局部强壮的子组或解决模式爆炸,但我们是第一个从全球建模角度同时解决这两个挑战的爆炸。首先,我们制定广泛的模型类别的子组列表,即订购的子组,可以组成的单次组和多变量目标,该目标可以由标称或数字变量组成,并且包括其定义中的传统Top-1子组发现。这种新颖的模型类允许我们使用最小描述长度(MDL)原理来形式地形化最佳强大的子组发现,在那里我们分别为标称和数字目标的最佳归一化最大可能性和贝叶斯编码而度假。其次,正如查找最佳子组列表都是NP-Hard,我们提出了SSD ++,一个贪婪的启发式,找到了很好的子组列表,并保证了根据MDL标准的最重要的子组在每次迭代中添加,这被显示为等同于贝叶斯一个样本比例,多项式或子组之间的多项式或T检验,以及数据集边际目标分布以及多假设检测罚款。我们经验上显示了54个数据集,即SSD ++优于先前的子组设置发现方法和子组列表大小。
translated by 谷歌翻译
无监督的离散化是许多知识发现任务中的关键步骤。使用最小描述长度(MDL)原理局部自适应直方图的一维数据的最先进方法,但研究多维情况的研究要少得多:当前方法一次考虑一个尺寸(如果不是独立的),这导致基于自适应大小的矩形细胞的离散化。不幸的是,这种方法无法充分表征维度之间的依赖性和/或结果,包括由更多的单元(或垃圾箱)组成的离散化。为了解决这个问题,我们提出了一个表达模型类,该类别允许对二维数据进行更灵活的分区。我们扩展了一维情况的艺术状态,以基于归一化最大似然的形式获得模型选择问题。由于我们的模型类的灵活性是以巨大的搜索空间为代价的,因此我们引入了一种名为Palm的启发式算法,该算法将每个维度交替划分,然后使用MDL原理合并相邻区域。合成数据的实验表明,棕榈1)准确地揭示了模型类(即搜索空间)内的地面真相分区,给定的样本量足够大; 2)近似模型类外的各种分区; 3)收敛,与最先进的多元离散方法IPD相比。最后,我们将算法应用于三个空间数据集,我们证明,与内核密度估计(KDE)相比,我们的算法不仅揭示了更详细的密度变化,而且还可以更好地拟合看不见的数据,如日志流利性。
translated by 谷歌翻译
由于其样本的复杂性很高,截至今天,模拟对于成功应用增强学习至关重要。然而,许多现实世界中的问题都表现出过度复杂的动力学,这使其全尺度模拟在计算上很慢。在本文中,我们展示了如何将许多代理的大型网络系统分解为多个局部组件,以便我们可以构建独立和并行运行的单独模拟器。为了监视不同局部组件彼此施加的影响,这些模拟器中的每个模拟器都配备了一个经过定期训练实际轨迹的模型。我们的经验结果表明,在不同的过程之间分配仿真不仅可以在短短几个小时内训练大型多机构系统,还可以帮助减轻同时学习的负面影响。
translated by 谷歌翻译
根据自我监督的方法,我们根据预先训练的深网络重新审视水印技术。我们提出了一种方法来将标记和二进制消息嵌入到其潜在空间中,利用在标记时间时使用数据增强。我们的方法可以在任何分辨率下运行,并在广泛的转换(旋转,作物,JPEG,对比度等)中创建水印稳健。它显着优于先前的零位方法,其对多比特水印的性能与最先进的编码器 - 解码器架构是对水印的端到端训练的端到端的平台。我们的实施和型号将公开可用。
translated by 谷歌翻译
在十亿缩放的数据集中快速检索类似载体的现代方法依赖于压缩域方法,例如二进制草图或产品量化。这些方法最小化了一定的损失,通常是针对检索问题量身定制的平均平方误差或其他目标函数。在本文中,我们重新解释了流行的方法,例如二进制散列或产品量化器作为自动编码器,并指出它们在解码器的形式上隐式制作次优假设。我们设计了向后兼容的解码器,可从相同的代码改进向量的重建,这转化为最近的邻居搜索中的更好性能。我们的方法显着提高了流行基准的二进制散列方法或产品量化。
translated by 谷歌翻译
潜在文本表示展示了几何规律,如着名的类比:女王是王的女人是男人。在图像表示上没有证明这种结构化语义关系。最近的作品,旨在将该语义差距缩短嵌入图像和文本到多峰空间,使传送文本定义的变换传输到图像模态。我们介绍SIMAT数据集以评估文本驱动图像变换的任务。 SIMAT包含6K图像和18K“转换查询”,其瞄准替换场景元素或更改其成对关系。目标是检索与(源图像,转换)查询一致的图像。我们使用匹配Oracle(OSCAR)的图像/文本来评估图像转换是否成功。 SIMAT DataSet将被公开可用。我们使用SIMAT来表明Vanilla Clip MultimoDal Embeddings不太适合文本驱动的图像转换,但Coco DataSet上的简单FineTuning可以带来戏剧性的改进。我们还研究利用普雷雷普雷普明的通用句子编码器(FastText,Lable和Labse)的几何特性是有益的。
translated by 谷歌翻译